Objetivos de Aprendizagem
- Descreva o ciclo de vida do pré-treinamento e ajuste fino dos LLMs.
- Explore o Aprendizado por Reforço a partir de Feedback Humano (RLHF).
- Pratique Engenharia de Prompt e métodos eficientes em parâmetros para ajuste fino (PEFT/LoRA).